【拓墣观点】靠吃大数据才能养出 AI?逆势思考的技术也在萌芽中
自从 Google 的人工智慧 AlphaGO 成为围棋界的百胜将军开始,AI(Artificial Intelligence,人工智慧)这两个英文字,刹那间成为科技业最热门的关键字之一。而就在 2017 年初,早在 AI 领域打下深厚底子的 IBM Watson,除了打进一些数据服务公司、科技公司外,甚至进军医疗领域,能够依照病患资料判定青光眼,准确率高达 95%。
我们现在已经迈入 AI 与机器人逐渐取代人类工作的年代,在不知不觉间,AI 的相关技术已经开始渗透每个人的生活角落,从 Google 与 Facebook 依照兴趣投放的广告、可以帮你找资料设定行事历的语音助理 Siri,背后都含有 AI 的概念与技术。未来的生活无论是投资、交通、医疗、学习、生产,将无处不是 AI 的踪影,这个技术也将彻底改变人们的生活模式。
是什么让 AI 从「科幻」变「科技」?
AI 其实是个庞大而复杂的概念,但大都奠基于一项基础的关键技术,这个技术叫做「机器学习 」(Machine Learning)。
机器学习技术,就是让机械拥有自主学习的能力,说起来很简单,但在 1950 年代技术萌芽期间,演算法和硬体条件都不够成熟,是直到近年来日益优异的演算法,与强劲的硬体运算能力,才让机器学习的能力有突破性进展,而其中进展最快速的一项关键技术,就是大家最耳熟能详的──「深度学习」。
我们来看看这个数据:2015 年机器学习的周边市场规模约 3.6 亿美元,至 2020 年预估将突破 29 亿美元,并在 AI 整体市场的 50 亿美元中占了约 6 成比重,可以说机器学习的技术突破,就是 AI 市场发展的原动力。
既然机器学习重要,那么它究竟是什么?为何能进展神速?
「大数据」提高了深度学习精准度
演算法及硬体条件的大幅跃进提供了机器学习发展的优良条件,再加上数位化联网的蓬勃下带来的「大数据」,引爆了科技大厂争相投入深度学习技术的浪潮。目前不管是 NVIDIA 这类的晶片商,或擅长演算法的 Google、Facebook 等软体商,最常提到从事的机器学习的主流技术,就是深度学习。
举个例子描述深度学习如何进行。想像一下,要让一台搭载深度学习能力的车辆进行自动驾驶,面对陌生的路线、随时有行人冲出马路的危险路况,机器怎么判断?透过深度学习,你可先一次提供机器海量的数据资讯,包含路标、号志、路树、行人、等,让它学会辨识环境中的物体为何,学会了,便有助于它在行进过程中快速而精准地避开障碍、找出最佳路径,并顺利抵达目的地。只要数据越丰富完整,机器就越能够提高一切辨识的精准度,以加强判断能力。
这么说来,要能让 AI 靠「深度学习」发展思考能力,很大程度是依赖大数据所赐,不过,这时候我们就会面临一个问题:没有大数据,深度学习就毫无用武之地了吗?
「小数据」的机器学习方案也蓄势待发
大数据带给深度学习强而有力的判断能力,但其实机器若要做到「学习」这件事,深度学习并不是唯一方法。
回到自动驾驶的例子,倘若这次我们先不将海量的数据提供给机器,而是只告诉他「目的地」、「禁止碰撞」两项指令,然后任凭他不断的 Trial & Error,在失败中汲取「经验」以达到学习的效果,最终也能抵达目的地(前提当然是没有遭遇严重车祸影响行进能力)。这样在初始阶段不仰赖大数据的学习方式,可以归类为「强化学习」。
强化学习的方法能补足机器在突发状况下的应变能力,AlphaGO 的开发商 DeepMind 也深谙这项方法的优点,因此让 AlphaGO 也藉著深度学习与强化学习的组合,在对手下出意料之外的棋步时,随即建立新的经验,以做为未来在相同局势下能克敌制胜的判断依据。
为什么我们需要「小数据」的 AI 培养方案?
事实上,「获取足够大量的数据」就是极耗成本的一件事,此外,有些数据如罕见疾病的病历、症状等本身就具稀有性,因此像是强化学习等低数据依赖度机器学习方案逐渐开始受到青睐,许多公司与研究机构也以此作为研发的努力方向。日前就有一间名为 Gamalon 的新创公司发表新技术,表示其 AI 系统可仅用很少量的数据训练机器学习,就达到媲美进行深度学习后的精准辨识能力,成功吸引市场关注。
除了一般仰赖大数据的深度学习外,其他可降低数据量依赖度的机器学习方案正不断酝酿中。在不远的未来,我们开车出门只要安稳的在后座休息,不须担心安全与塞车问题,AI 自然会帮我们找到最佳路径;弹指轻点,手机便会帮我们挑选出最适合的购物选择;还可能有贴身的虚拟健康顾问可咨询,并随时告知我们每天的饮食是否均衡、甚至帮我们设计健康菜单。
AI 深入生活的程度,说不定会比我们想像中来得更快。
本文由拓墣产业研究院提供,想了解更多关于 AI 的现况发展?详见拓墣产业研究院的相关报告:《AI应用市场发展趋势与商机》
(首图来源:达志影像)